目標定義:
改為 return_threshold,只標記大於指定閾值的漲幅,忽略小波動。
這樣能減少雜訊,模型學到的方向更穩定。
模型參數:
RandomForest 增加 n_estimators=200, max_depth=10, min_samples_split=10, min_samples_leaf=5。
提升模型穩定性,減少過擬合。
特徵重要性分析:
每一次 walk-forward 分割都記錄特徵重要性。
最後計算平均重要性並畫圖,方便去掉低影響特徵。
平均準確度從0.5265來到了0.8860